Telegram Group & Telegram Channel
Как выбрать оптимальное число кластеров при кластеризации, например, методом k-средних (k-means)?

Один из самых известных эмпирических методов — метод локтя (Elbow Rule). Он предполагает вычисление суммы квадратов расстояний от точек до центра их кластеров для различного числа кластеров. График этой суммы по мере увеличения числа кластеров часто напоминает руку с локтем.

Алгоритм тут такой:
▫️Определяем разумный диапазон для числа возможных кластеров (например, от 1 до 10).
▫️Для каждого значения k запускаем алгоритм кластеризации и вычисляем сумму квадратов расстояний от каждой точки до центра её кластера.
▫️Наносим значения на график.
▫️Находим на графике точку, где изменение суммы квадратов расстояний начинает замедлятся — «локоть». Число кластеров в «локте» считается оптимальным.

#машинное_обучение



tg-me.com/ds_interview_lib/358
Create:
Last Update:

Как выбрать оптимальное число кластеров при кластеризации, например, методом k-средних (k-means)?

Один из самых известных эмпирических методов — метод локтя (Elbow Rule). Он предполагает вычисление суммы квадратов расстояний от точек до центра их кластеров для различного числа кластеров. График этой суммы по мере увеличения числа кластеров часто напоминает руку с локтем.

Алгоритм тут такой:
▫️Определяем разумный диапазон для числа возможных кластеров (например, от 1 до 10).
▫️Для каждого значения k запускаем алгоритм кластеризации и вычисляем сумму квадратов расстояний от каждой точки до центра её кластера.
▫️Наносим значения на график.
▫️Находим на графике точку, где изменение суммы квадратов расстояний начинает замедлятся — «локоть». Число кластеров в «локте» считается оптимальным.

#машинное_обучение

BY Библиотека собеса по Data Science | вопросы с собеседований




Share with your friend now:
tg-me.com/ds_interview_lib/358

View MORE
Open in Telegram


Библиотека собеса по Data Science | вопросы с собеседований Telegram | DID YOU KNOW?

Date: |

The STAR Market, as is implied by the name, is heavily geared toward smaller innovative tech companies, in particular those engaged in strategically important fields, such as biopharmaceuticals, 5G technology, semiconductors, and new energy. The STAR Market currently has 340 listed securities. The STAR Market is seen as important for China’s high-tech and emerging industries, providing a space for smaller companies to raise capital in China. This is especially significant for technology companies that may be viewed with suspicion on overseas stock exchanges.

Telegram Gives Up On Crypto Blockchain Project

Durov said on his Telegram channel today that the two and a half year blockchain and crypto project has been put to sleep. Ironically, after leaving Russia because the government wanted his encryption keys to his social media firm, Durov’s cryptocurrency idea lost steam because of a U.S. court. “The technology we created allowed for an open, free, decentralized exchange of value and ideas. TON had the potential to revolutionize how people store and transfer funds and information,” he wrote on his channel. “Unfortunately, a U.S. court stopped TON from happening.”

Библиотека собеса по Data Science | вопросы с собеседований from vn


Telegram Библиотека собеса по Data Science | вопросы с собеседований
FROM USA